Материалы по тегу: синтез речи

07.03.2023 [16:50], Андрей Крупин

Платформа Yandex Cloud дополнилась новым сервисом для синтеза речи Brand Voice Call Center

Облачная платформа Yandex Cloud представила новый сервис для синтеза речи Brand Voice Call Center.

Brand Voice Call Center разработан специально для автоматизации колл-центров и других задач бизнеса, предполагающих повсеместное использование телефонных звонков (телемаркетинг, приём звонков первой линии, опросы). В основу решения положены технологии машинного обучения и системы искусственного интеллекта на базе нейронных сетей, позволяющие сервису генерировать аудио с уникальным голосом по одной фразе.

Алгоритм обрабатывает аудиошаблон и на его основе синтезирует сотни таких же фраз, но при этом по скрипту может менять в них отдельные слова. Синтезированная речь в Brand Voice Call Center звучит естественно и передаёт все детали речи живого человека из шаблона: эмоции, интонации, изменения громкости. В качестве шаблонов компании могут использовать фрагменты телефонных записей реальных операторов своих колл-центров. Утверждается, что это первый подобный сервис на русском языке, выпущенный для коммерческого использования.

Для обучения Brand Voice Call Center специалисты Yandex Cloud использовали датасет с тысячами часов записей различных дикторов на русском языке из открытого доступа. Подобный опыт позволяет работать практически с любым голосом без предварительной подготовки. Чтобы речь звучала более естественно, для обучения моделей в сервисе использовали трансформерную архитектуру. В отличие от других нейронных сетей, трансформеры позволяют обучать ML-модели параллельно на современных видеокартах (GPU) и концентрироваться на важных частях текста, что повышает качество синтеза.

Постоянный URL: http://www.servernews.ru/1083024
Система Orphus